#red de atención con reservorio

Red de Atención con Reservorio: Memoria entre pasadas en Transformers

Descubre cómo la Red de Atención con Reservorio inyecta un reservorio fijo en Transformers preentrenados para mantener estado entre pases, usando solo una GPU

2026-06-16 · 2 min